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(54) Bezefchnung: VERFAHREN ZUM VERSCHLEIERN VON FEHLERN IN EINEM AUDIODATENSTROM 



(57) Abstract 

The invention relates to a method for masking defects in a stream of audio data. Defects in a stream of audio data which was 
previously intact are detected and a spectral energy of a sub-group of the intact audio data is then calculated. After a model has been 
created for replacement data, based on the spectral energy calculated for the sub-group of intact audio data, replacement data is generated 
for defective or absent audio data, said replacement data corresponding to the sub-group, based on the model. 



(57) Zusammenfassung 

Bei einem Verfahren zum Verschleiem von Fehlern in einem Audiodatenstrom wird in dem Audiodatenstrom das Auftreten eines 
Fehlers erfaBi. wobei Audiodaten vor Auftreten des Fehlers intakte Audiodaten sind. AnschlieBend wird eine spektrale Energie einer 
Untergruppe der intakten Audiodaten berechnet Nach dem Bilden einer Vorlage fur Ersatzdaten aufgrund der fur die Untergruppe 
der intakten Audiodaten berechneten spektralen Energie werden Ersatzdaten fur fehlerhafte oder nicht vorhandene Audiodaten, die der 
Untergruppe entsprechen. aufgrund der Vorlage erzeugt. 
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Verfahren zum Verschleiern von Pehlern 
in einem Audiodatenstrom 



Beschreibunq 



Die vorliegende Erfindung bezieht sich auf Audiocodierver- 
fahren und insbesondere auf Fehlerverschleierungstechniken 
beim Codieren von Audiosignalen. 

Das sogenannte "Internet Radio Broadcasting", d. h. das 
tibertragen eines Radioprogramms live iiber das Internet, er- 
fordert es, Tausende von Echtzeitverbindungen zwischen einem 
Sender und Empf angerprogrammen, die sich beispielsweise in 
einem Personalcomputer eines Internetteilnehmers befinden, 
auf zubauen. 

Das derzeit am haufigsten verbreitete Internet-Protokoll 
http stellt eine fehlerfreie Ubertragung sicher , dasselbe 
besitzt jedoch keine Echtzeiteigenschaften. Dieses Protokoll 
bedingt eine zur Anzahl der empfangenen Stationen proportion 
nale Netzlast beim Sender- Somit ist die Anzahl der gleich- 
zeitigen Horer je nach Datenrate des codierten Signals typi- 
scherweise auf wenige Hundert begrenzt, was fur "Rundfunkan- 
wendungen" , d. h. Anwendungen, bei denen Radio- Oder Fern- 
sehsignale iibertragen werden sollen, sicher nicht ausreicht. 

Neue Protokolle zur tibertragung von Daten uber das Internet, 
wie z. B. rtp (rtp = realtime transmission protocol = Echt- 
zeittibertragungsprotokoll) , umgehen diesen Flaschenhals, in- 
dem sie im Gegensatz zu dem Protokoll http Fehler in der 
Ubertragung zulassen. 

Dadurch stellt sich fur den Empf anger das Problem, wie er 
mit fehlerhaften Ubertragungsdaten umgehen soil. Wie wird 
beispielsweise das Fehlen von Teilen eines Multimedia- oder 
Audiodatenstroms ttberbrttckt? 
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Zur Fehlerbehandlung sind im Stand dcr Technik einige Ver- 
fahren bereits bekannt. Beim Verfahren des Stummschaltens, 
welches die einfachste Art der Fehlerverschleierung ist, 
wird die Wiedergabe abgeschaltet, solange Daten fehlen oder 
fehlerhaft sind. Die fehlenden Daten werden durch ein Null- 
signal ersetzt. Aufgrund psychoakustischer Effekte wird die- 
ses plotzliche Abfallen und Ansteigen der Signalenergie als 
sehr unangenehm empfunden* Ein Stummschaltverf ahren ist bei- 
spielsweise in Detlef Wiese: "Error Concealment Strategies 
for Digital Audio Broadcasting" , 92* AES Convention, Wien 
1992 , Preprint 3264, und in Detlef Wiese: "Anwendung von 
Fchlerverschleierungstechniken fur digitalen Horrundfunk 
(DAB) 99 , 9 . ITG-Fachtagung "Horrundfunk" , Mannheim 2/92 , 
beschrieben. 

Ein we i teres bekanntes Verfahren ist das Verfahren der Da- 
tenwiederholung. Fallt ein Datenstrom aus, wird ein Teil der 
zuletzt gesendeten Daten in einer Schleife wiederholt. Bei 
blockorientierten Verfahren, welche die Mehrheit bekannter 
Audiocodierverf ahren sind, wiirden also beispielsweise der 
oder die zuletzt empfangenen Blocke wiederholt. Ein derarti- 
ges Verfahren ist aus den bereits zitierten Literaturstellen 
bekannt . 

Dieses Verfahren fuhrt jedoch zu storenden Artefakten: Wer- 
den nur kurze Teile des Audiosignals wiederholt, so klingt 
das repetierte Signal - unabhangig vom Original signal - ma- 
schinenartig mit einer Grundf requenz bei der Wiederholf re- 
quenz. Werden langere Teile wiederholt, entstehen "Echo- 
effekte", die ebenfalls als storend empfunden werden. 

Ein weiteres Verfahren, das Verfahren der Dateninterpola- 
tion, baut auf der Wahrscheinlichkeit , daB bei Ubertragung 
eines Datenstroms mit relativ hoher Verzogerung bereits wie- 
der giiltige Audiodaten vorliegen, wenn eine Fehlerliicke des 
Audiodatensignals verschleiert werden muB. Es kann eine In- 
terpolation verwendet werden, um Daten in der Lticke zu gene- 
rieren, wie es in Laurent Filliat, Mario Rossi, Joseph Mai- 
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sano, "Error Correction by Interpolation in Digital Audio", 
92. AES Convention, Wien 1992, Preprint 3281, beschrieben 
ist. 

Ein Nachteil dieses Verfahrens besteht beispielsweise darin, 
daB die Verzogerung in vielen Fallen nicht hinnehmbar ist, 
insbesondere , wenn an Telef onieanwendungen gedacht wird. 

Bei blockorientierten Trans f ormationscodierern/Decodierern 
kann die Signalenergie pro Spektrallinie von einem Block auf 
den nachsten vorhergesagt oder "pradiziert" werden. Dieses 
bekannte Verfahren (Jurgen Herre: "Fehlerverschleierung bei 
spektral codierten Audiosignalen" , Dissertation, Universitfit 
Erlangen-Nurnberg, Erlangen 1995) fiihrt zwar zu einer guten 
Fehlerverschleierung, es ist jedoch ein relativ hoher Re- 
chenaufwand vonnoten, der derzeit eine Echtzeitdecodierung 
eines empfangenen Multimedia- oder Audiodatensignals unmog- 
lich macht. 

In der Technik ist es ebenfalls bekannt, die Redundanz im 
Datenstrom zu erhohen. Es ist moglich, in einen Audiodaten- 
strom bereits beim Codierer oder Sender einen zweiten Daten- 
strom einzufugen, der dasselbe Signal (bei eventuell niedri- 
gerer Datenrate und entsprechend niedrigerer Qualitat) iiber- 
tragt. Versetzt man diesen zweiten Datenstrom zeitlich ge- 
geniiber dem ersteren, so ist es wahrscheinlich, daB zu jedem 
Zeitpunkt wenigstens aus einem der beiden Strome giiltige Da- 
ten empfangen werden* Somit kann der Ausfall eines Signals 
durch das andere Signal uberbrttckt werden. Dieses Verfahren 
liefert bei fehlerhaftem Hauptsignal eine inf ormationstreue 
Wiedergabe, die jedoch iiblicherweise eine schlechtere Quali- 
tat haben wird. 

Wie auch das vorhergehende Verfahren erhoht dieses Verfahren 
die Verzogerung zwischen Sender und Empf anger, weshalb die 
gleichen Nachteile wie bei der Dateninterpolation vorhanden 
sind. Weiterhin wird die Datenrate erhoht, da ja ein zweites 
gewissermaBen identisches Signal ubertragen wird, was insbe- 
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sondere bei kleinen Datenraten oder verfiigbaren Ubertra- 
gungsbandbreiten nicht akzeptabel sein kann. 

Bei der Ubertragung eines Stereosignals existiert ein weite- 
res Verfahren, um Fehler in der Ubertragung zu verschleiern, 
Bei dem Verfahren der Links/Rechts-Ersetzung kann der ge- 
storte oder ausgefallene Kanal durch den jeweils anderen Ka- 
nal ersetzt werden, wie es in Detlef Wiese: "Error Conceal- 
ment Strategies for Digital Audio Broadcasting", 92. AES 
Convention, Wien 1992, Preprint 3264, Detlef Wiese: "Anwen- 
dung von Fehlerverschleierungstechniken fiir digitalen Hor- 
rundf unk (DAB) " , 9 . ITG-Fachtagung "HSrrundf unk" , Mannheim 
2/92, und Jiirgen Herre: "Fehlerverschleierung bei spektral 
codierten Audiosignalen" , Dissertation, Universitat Erlan- 
gen-Nurnberg, Erlangen 1995, beschrieben ist. Im allgemeinen 
werden jedoch die Daten fur beide Kanale gleichzeitig iiber- 
tragen und daher auch gleichzeitig gestort. Andernfalls han- 
delt es sich hier um einen Spezialfall zvim Verfahren der Er- 
hohung der Redundanz im Datenstrom. Dieses Verfahren kann 
ferner nur dann angewendet werden, wenn der linke und der 
rechte Kanal unabhangig voneinander decodierbar sind. Es ist 
jedoch beispielsweise bei den sogenannten "Joint Stereo" - 
Modi, die durch den Standard-MPEG Layer-3 definiert sind, 
nicht moglich. 

Die Aufgabe der vorliegenden Erfindung besteht darin, ein 
Verfahren zum Verschleiern von Fehlern in einem Audiodaten- 
strom zu schaffen, das eine effektive und moglichst nicht 
horbare Fehlerverschleierung erreicht. 

Diese Aufgabe wird durch ein Verfahren gemaB Anspruch 1 ge- 
16st. 

Das Verfahren zum Verschleiern von Fehlern in einem Audio- 
da tenstrom gemaB der vorliegenden Erfindung umfaBt folgende 
Schritte: 

Erfassen des Auftretens eines Fehlers in einem Audiodaten- 
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strom, wobei Audiodaten vor Auftreten des Fehlers intakte 
Audiodaten sind; 

Berechnen einer spektralen Energie in einer Untergruppe der 
intakten Audiodaten; 

Bilden einer Vorlage fur Ersatzdaten aufgrund der fur die 
Untergruppe der intakten Audiodaten berechneten spektralen 
Energie ; und 

Erzeugen der Ersatzdaten fur fehlerhafte Oder nicht vorhan- 
dene Audiodaten, die der Untergruppe entsprechen, aufgrund 
der Vorlage. 

Eine Untergruppe im Sinne dieser Anmeldung umfaBt jeweils 
mehrere auf einanderf olgende Frequenzlinien. Der Frequenz- 
bereich wird also in auf einanderf olgende Untergruppen einge- 
teilt, wobei jede Untergruppe auf einanderf olgende Frequenz- 
linien hat. Vorzugsweise konnen die Untergruppen den aus der 
Psychoakustik bekannten Frequenzgruppen entsprechen. Es kann 
jedoch auch eine von den Frequenzgruppen abweichende Eintei- 
lung fur die Untergruppen gewahlt werden, wie es weiter hin- 
ten beschrieben ist. 

Wie es aus der spateren detaillierten Beschreibung offen- 
sichtlich wird, lost dieses Verfahren im Stand der Technik 
vorhandene Nachteile, da es weder eine erhohte Verzogerung 
noch eine Erhohung der Datenrate, d. h. eine Anderung der 
Quellencodierung erfordert, noch die unangenehme Zeit- und 
Frequenzstruktur eines einfach repetierten Signalabschnitts 
aufweist. Im Gegensatz beispielsweise zum Verfahren der 
spektralen Pradiktion, das bereits umrissen wurde, liefert 
das erf indungsgemaBe Verfahren eine gehorangepaBte Rausch- 
substitution. Ausgegangen wird von einer Frequenzdarstellung 
eines zeitlichen Audiosignals, welche auf viele fiir Fachleu- 
te bekannten Arten und Weisen erhalten werden kann. Wie es 
von Zwicker und Fasti in "Psychoacoustics, Facts and Mo- 
dels", 1990, dargelegt wurde, kann das Spektrum eines Si- 
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gnals in sogenannte Frequenzgruppen gruppiert werden. Dies 
ftihrt zu einer Skalierung der Freguenzachse in Bark, welche 
gehorrelevante Eigenschaf ten beriicksichtigt , und zwar im 
Gegensatz zu einer iiblichen Skalierung der Freguenzachse in 
Hertz. Ein Bark ist die Frequenzdif f erenz zwischen benach- 
barten Frequenzgruppen. Eine Frequenzgruppe ist, wie es von 
Zwicker definiert wurde, die maximale Bandbreite, innerhalb 
der die Intensitaten einzelner Tone durch das menschliche 
Ohr summiert werden, urn Horschwellen zu bilden. 

Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, 
daB es fur eine Fehlerverschleierung ausreicht, ein "gut" 
spektral geformtes Zuf allssignal zu erzeugen. "Gut" bedeutet 
in diesem Zusammenhang , daB die spektralen Energien in Fre- 
quenzgruppen des Zufallssignals mit den spektralen Energien 
der intakten Audiodaten vor Auftreten des Fehlers uberein- 
stimmen bzw. von denselben hergeleitet sind. 

Bevor auf verschiedene Ausf uhrungsbeispiele der vorliegenden 
Erfindung eingegangen wird, werden weitere Begriffe, die fur 
das Verstandnis der Erfindung wesentlich sind, kurz erlau- 
tert. 

Wenn in dieser Anmeldung von einer "spektralen Energie" ei- 
ner Frequenzlinie die Rede ist, so wird darunter das Be- 
tragsquadrat dieser beispielsweise durch eine Fourier-Trans- 
formation errechneten Spektralkomponente verstanden. Wenn 
dagegen von der "spektralen Energie" einer Untergruppe ge- 
sprochen wird, so wird darunter die Summe der quadrierten 
Betrage der Spektralkomponenten in dieser Untergruppe ver- 
standen, welche beispielsweise durch eine Fourier-Trans- 
formation errechnet worden sind. Wichtig ist jedoch, anzu- 
merken, daB der Ausdruck "spektrale Energie" nicht vollig 
streng verwendet wird. Wird beispielsweise das Verfahren der 
vorliegenden Erfindung in einem Codierer ausgefiihrt, der 
nach MPEG Layer-3 arbeitet, so ISuft das Verfahren auf der 
Basis von MDCT-Linien (MDCT = modifizierte diskrete Cosinus 
Transformation) ab. Die dort verwendete modifizierte diskre- 
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te Cosinus Transformation, welche eine Uberlappung und Fen- 
sterung beinhaltet, ist jedoch im strengen Sinne nicht ener- 
gieerhaltend. Das bedeutet, daB es keinen einfachen Weg 
gibt, aus MDCT-Spektren die Energie pro Frequenzlinie im 
Sinne beispielsweise einer Fourier-Transformation zu finden. 
Umgekehrt ist es bei Kenntnis dieser Energie nicht ohne wei- 
teres moglich, ein MDCT-Spektrum zu erzeugen, das die ge- 
forderte Energie enthalt. Der Ausdruck "spektrale Energie" 
bezieht sich also sowohl auf die energieerhaltende Fourier- 
Transformation als auch auf die ,, nicht ,, -energieerhaltende 
modifizierte diskrete Cosinus Transformation oder auf ahnli- 
che nicht-energieerhaltende Transf ormationsverf ahren, welche 
bekannt sind. Die Nutzlichkeit des Verfahrens gemaB der vor- 
liegenden Erfindung hangt allerdings auch nicht von einer 
genauen Energieerhaltung ab, da das Verfahren zum Verschlei- 
ern von Fehlern in einem Audiodatenstrom gerade nicht eine 
exakte Wiederherstellung der Ur sprungsdaten , welche im all- 
gemeinen nicht moglich ist, sondern eben eine Abschatzung 
von Ersatzdaten betrifft, die bewirken, daB ein aufgetrete- 
ner Fehler moglichst unhorbar und damit verschleiert wird. 

Weiterhin wird in dieser Anmeldung ofters von Audiodaten vor 
Auftreten des Fehlers oder von intakten Audiodaten gespro- 
chen. Es sei angemerkt, daB sich diese Ausdrucke nicht auf 
den eigentlichen Empf angsprozeB beispielsweise eines vom In- 
ternet lesenden Programmes bezieht. Bei manchen Internet- 
Protokollen konnen sequentiell abgeschickte Datenpakete in 
anderer Reihenfolge ankommen. Wird also von Audiodaten vor 
Auftreten eines Fehlers gesprochen, so wird damit nicht auf 
die Echtzeit Bezug genommen, sondern auf die durch den Au- 
diodatenstrom vorgegebene Reihenfolge. Weiterhin sei ange- 
merkt , daB Audiodaten vor Auftreten eines Fehlers selbstver- 
standlich zu einem noch friiheren Zeitpunkt ebenfalls fehler- 
haft bzw. nicht vorhanden gewesen sein konnten. Wenn jedoch 
in einem Audiodatenstrom ein Fehler erfaBt wird, so bedeutet 
dies, daB auf jeden Fall vor Auftreten des Fehlers intakte 
Audiodaten vorhanden gewesen sind. Dies bedeutet also nicht, 
daB das Verfahren der vor liegenden Erfindung lediglich den 
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allerersten Fehler in einem Audiodatenstrom behandeln kann. 

Wie bereits erwahnt wurde, wird in dieser Anmeldung das un- 
erwartete Nichtvorhandensein von Audiodaten ebenfalls wie 
das Vorhandensein von f ehlerhaften, d. h. teilweise zerstor- 
ten, Audiodaten als Fehler bezeichnet. Wenn also fehlerhafte 
Audiodaten durch Ersatzdaten ersetzt werden, so bedeutet 
dies, daB entweder teilweise zerstorte Audiodaten durch Er- 
satzdaten ersetzt werden, oder daB an der Stelle, an der un- 
erwarteterweise keine Audiodaten vorhanden sind, Ersatzdaten 
eingesetzt werden. 

Wenn ferner in dieser Anmeldung davon gesprochen wird, daB 
aufgrund von intakten Audiodaten spektrale Energien berech- 
net werden, so soil dies nicht bedeuten, daB die gesamten 
intakten Audiodaten zwischen dem aktuellen und dero letzten 
Fehler verwendet werden. Stattdessen ist die Menge der in- 
takten Audiodaten, die den Audiodatenstrom vor Auftreten des 
Fehlers darstellen, von dem einzelnen Anwendungsf all abhan- 
gig. Bei Ausf uhrungsbeispielen der vorliegenden Erfindung, 
welche blockbasierend arbeiten, kann die Menge der intakten 
Audiodaten beispielsweise nur Audiodaten des letzten Blocks 
oder mehrerer letzter Blocke umfassen. Ferner miissen nicht 
unbedingt alie intakten Audiodaten beispielsweise eines 
Blocks verwendet werden, sondern lediglich beispielsweise 
Audiodaten, die Inf ormationeh liber Energien pro Untergruppe 
aufweisen. Eine Starke des Verfahrens der vorliegenden 
Erfindung besteht ja gerade darin, daB nicht unbedingt alle 
Frequenzlinien gespeichert und im Fehlerfall prSdiziert wer- 
den miissen. Je mehr Audiodaten jedoch zum Bilden einer Vor- 
lage fur Ersatzdaten verwendet werden, urn so praziser konnen 
Ersatzdaten aus der spektralen Vorlage erzeugt werden, um 
einen Fehler besser zu verschleiern. 

Im nachfolgenden wird das erf indungsgemaBe Verfahren anhand 
eines Audiocodierverf ahrens, das spektral codierte Audio- 
daten erzeugt und ubertragt, beispielhaft dargestellt. Die 
meisten modernen Audiocodierverf ahren, wie z. B. MPEG Layer 
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1-3 , MPEG AAC, Dolby AC-3 , PAC, liefern spektral codierte 
Audiodaten, welche von einem entsprechenden Decodierer emp- 
fangen, decodiert und wieder in den Zeitbereich umgesetzt 
werden • 

Wie es allgemein bekannt ist, wird ein zu codierendes ana- 
loges Signal mit einer geeigneten Abtastfrequenz, wie z. B. 
44,1 kHz, abgetastet, um ein diskretes Zeitsignal zu erhal- 
ten. Ein solches diskretes Zeitsignal kann nun mittels einer 
geeigneten Fensterfunktion gefenstert werden, um Blocke mit 
einer bestimmten Anzahl von einzelnen zeitdiskreten Signal- 
werten zu erhalten, welche insbesondere zu den Randern der 
Blocke hin durch die Fensterfunktion gewichtet sind, wie es 
in der Nactirichtentechnik allgemein bekannt ist. Ein Block 
mit mittels einer Fensterfunktion gewichteten zeitdiskreten 
Signalen wird nun mittels eines geeigneten Transf ormations- 
verfahrens vom Zeitbereich in den Frequenzbereich transfor- 
miert. Geeignete Transf ormationsverf ahren konnen eine 
schnelle Four iertrans format ion (FFT) , ein Filterbankverf ah- 
ren Oder eine modifizierte diskrete Cosinustransf ormation 
(MDCT) sein* Ein Block von zeitdiskreten Signalen liegt nach 
der Transformation als ein Block von Frequenzlinien vor. Der 
Block von Frequenzlinien oder das Frequenzspektrum des 
Blocks von zeitdiskreten Signalwerten kann nun quantisiert 
werden. Unter Berucksichtigung psychoakustischer Gesichts- 
punkte ist es unter bestimmten Voraussetzungen moglich, eine 
durch die Quantisierung eingefuhrte Quant is ierungsstorung 
derart zu gestalten, daB sie nicht horbar ist, d. h- daB sie 
unter der Horschwelle des menschlichen Gehors liegt. 

Bei modernen Audiocodierverf ahren werden die nun in quanti- 
sierter Form vorliegenden Spektrallinien einer Redundanzre- 
duktion, beispielsweise mittels einer Huf f man-Codierung , un- 
terzogen und zusammen mit zur Decodierung notwendigen Sei- 
teninf ormationen in einen Audiodatenstrom gepackt, der nun 
zur Ubertragung zu einem Empf anger bereitsteht. 

An dieser Stelle sei angemerkt, daB der Ausdruck "Audioda- 
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tenstrom" in dieser Anmeldung nicht nur wie vorher beschrie- 
ben erzeugte Audiodatenstrome erfaBt, sondern jegliche Form 
von Audiodaten, seien sie codiert Oder uncodiert. So ist es 
fur die vorliegende Erfindung nicht erf order lich, daB der 
Audiodatenstrom in gleichlange Blocke oder iiberhaupt in 
Blocke eingeteilt ist. Liegt der Audiodatenstrom jedoch 
spektral codiert in Blockform vor, so kann das erf indungsge- 
maBe Verfahren mit geringstem Aufwand implementiert werden. 
Liegt der Audiodatenstrom in einer anderen Form vor, so kon- 
nen die Audiodaten mittels bekannter Schritte und Verfahren 
aufbereitet werden, um das erf indungsgemaBe Verfahren durch- 
zufiihren. 

Das Verfahren gemaB der vorliegenden Erfindung weist somit 
vier Schritte auf . Der erste Schritt besteht darin, das Auf- 
treten eines Fehlers in einem Audiodatenstrom zu erfassen, 
der zweite Schritt und der dritte Schritt bestehen darin, 
eine spektrale Energie einer Untergruppe in den Audiodaten 
zu berechnen, die den Audiodatenstrom vor Auftreten des 
Fehlers darstellen, d. h. in den intakten Audiodaten, und 
dann eine Vorlage fur Ersatzdaten aufgrund der fur die 
Untergruppe der intakten Audiodaten berechneten spektralen 
Energien zu bilden. Der letzte Schritt besteht dann darin, 
Ersatzdaten fur fehierhafte oder nicht vorhandene Audiodaten 
aufgrund der Vorlage fur die Untergruppe, fur die die Vorla- 
ge gebildet ist, zu erzeugen. 

Der erste Schritt besteht also im Erfassen des Auftretens 
eines Fehlers. Fallt der Eingangsdatenstrom weg oder weist 
er Fehler auf, welche mittels geeigneter Einrichtungen bei- 
spielsweise zum Uberpriifen einer Priifsumme oder ahnlichem in 
einem codierten Audiosignal erfaBt werden konnen, kann bei- 
spielsweise ein bestimmter Anteil der Daten vor Auftreten 
dieses Fehlers z. B. in einem Ringpuffer gespeichert werden. 

Das Verfahren gemaB der vorliegenden Erfindung berechnet nun 
fiir jede Untergruppe die spektrale Energie. WShrend die 
bekannte Variante zur linienweisen Pradiktion typischerweise 
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das 20- bis 30-fache an Speicher und Rechenoperationen im 
Vergleich zum Verfahren der vorliegenden Erfindung (wenn die 
Untergruppen den Frequenzgruppen entsprechen) benotigt, kann 
die spektrale Energie fiir jede Untergruppe gemaB der vorlie- 
genden Erfindung effizient und sparsam berechnet werden. Es 
sei jedoch dennoch darauf hingewiesen, daB der genannte 
Speicher- und Rechenoperationsaufwand lediglich bezuglich 
der Fehlerverschleierung gilt. Die Gesamtkomplexitat (Spei- 
cher oder Rechenzeit) beispielsweise eines kompletten MPEG- 
Layer— 3 -Decodierers nimmt in der Regel nicht wesentlich zu. 
Wird dagegen eine linienweise Pradiktion eingesetzt, so wird 
der Gesamtrechenaufwand des Codierers/ Decodierers sehr wohl 
signifikant ansteigen. 

Die spektrale Energie pro Untergruppe berechnet sich als 
Summe der Betragsquadrate der in der Untergruppe enthaltenen 
Spektralkomponenten. Die spektrale Energie pro Untergruppe 
entspricht also der Summe der quadrierten Linien in dieser 
Untergruppe. Dies gilt sowohl bei der Verwendung einer MDCT 
als auch bei der Verwendung einer FFT fur die Zeit-Fre- 
quenz-Transf ormation, um zeitdiskrete Audiosignale in den 
Frequenzbereich zu trans formier en, wie es bei modernen Co- 
dierern iiblich ist. An dieser Stelle sei jedoch auf die vor- 
her gemachten Anmerkungen hingewiesen , daB die MDCT im Ge- 
gensatz zur Fourier-Transformation nicht exakt energieerhal- 
tend ist. 

Die spektrale Energie einer Untergruppe ist somit die Grund- 
lage dafxir, eine Vorlage fur Ersatzdaten zu bilden. Die Er- 
satzdaten sollen ein "spektral-durchschnittliches" Spektrum 
im Sinne der Kurzzeitstatistik aufweisen. "Spektral-durch- 
schnittlich" bedeutet, daB ein Teil eines solchen Signals, 
wenn er nach dem Verfahren der vorliegenden Erfindung er- 
setzt wird, nicht besonders auf fallen wird, d. h. daB die 
Ersetzung verschleiert ist. 

Aus Einf achheitsgriinden findet die nachfolgende Darstellung 
der vorliegenden Erfindung anhand eines blocker ientierten 
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Verfahrens dar, wie es bei den meisten modernen Audiocodie- 
rern der Fall ist. Es sei jedoch darauf hingewiesen, daB die 
vorliegende Erfindung nicht auf ein blockorientiertes Ver- 
fahren begrenzt ist, Voraussetzung fiir das Verfahren ist, 
daB Inf ormationen uber die spektrale Zusammensetzung des Si~ 
gnales erhalten werden konnen, um aus denselben die spektra- 
le Energie pro Untergruppe zu berechnen. (Dies ist naturge- 
maB bei blockorientierten Transf ormationscodecs besonders 
einf ach. ) 

Zur Ermittlung der Vorlage, d. h. der Kurzzeitstatistik, fiir 
Ersatzdaten werden in der Vergangenheit empfangene (intakte) 
Da ten verwendet. Prinzipiell wiirde es auch moglich sein, 
nach Einfugen einer Verzogerung in den Signalpfad "zuktinfti- 
ge" Daten nach einem Fehler zu verwenden und eine Interpola- 
tion durchzufiihren. Der Nachteil dabei besteht jedoch in der 
bereits erwahnten Verzogerung. Das Verfahren der vorliegen- 
den Erfindung wendet jedoch keine Interpolation sondern eine 
Pradiktion an. Von Pradiktion kann gesprochen werden, da das 
Ergebnis dieser Operation immer ein zeitlich spater liegen- 
den Spektruia ist, das aus zeitlich friiheren Daten abgeleitet 
wird. Es werden also immer Audiodaten vor Auftreten eines 
Fehlers, d. h. intakte Audiodaten, verwendet, um im Falle 
eines auftretenden Fehlers ktinstlich erzeugte Ersatzdaten 
statt fehlerhafter Daten bzw. statt nicht vorhandener Daten 
einzufugen, um den Fehler zu verschleiern. Trotzdem sei da- 
rauf hingewiesen, daB der Ausdruck "Pradiktion" in der Li- 
teratur meist enger ausgelegt wird. Das Bilden einer Vorlage 
ftir Ersatzdaten aufgrund der ftir die Untergruppe der intak- 
ten Audiodaten berechneten spektralen Energie kann mehr oder 
weniger aufwendig und damit auch mehr oder weniger genau 
gestaltet sein. 

Fiir die nachfolgend dargelegten einzelnen Verfahren seien 
zuerst folgende Konventionen festgelegt. So bedeutet das 
Kurzzeitspektrum, d. h. den Vektor aus Kurzzeitspektralkom- 
ponenten, eines Blocks i. E^Cf) stellt die spektrale Energie 
einer Untergruppe der Mittenf requenz f im Block i dar. Dabei 
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sei f estgehalten, daB i = 0 den zu pradizierenden Block, d. 
h. den Block von Ersatzdaten darstellt, wahrend negative i 
die gespeicherten Blocke der intakten Audiodaten darstellen, 
und N der Anzahl der gespeicherten Blocke entspricht. E v (f) 
moge fiir die durch die Vorlage in der Untergruppe der Mit- 
tenfrequenz f geforderte Energie stehen. 

Aufsteigend sortiert nach der Komplexitat zur Berechnung 
konunen folgende Verfahren zum Bilden einer Vorlage fiir Er- 
satzdaten in Frage: 

1. Die spektralen Energien pro Untergruppe des zuletzt emp- 
fangenen Blocks werden direkt als Vorlage fur den feh- 
lenden Block verwendet. Dies kommt in folgender Glei- 
chung zum Ausdruck: 

Ey = E_i 

2. Die Vorlage entsteht als lineare Kombination von Poten- 
zen der spektralen Energien entsprechender Untergruppen 
vergangener Blocke: 

— N bi 
E v (f) = S aiEi(f) 
i=-l 

a^ sind konstante Koef f izienten zur linearen Kombina- 
tion, wShrend b^ Exponenten zur Gewichtung der einzelnen 
spektralen Energien sind. Der hier wiederum einfachste 
Fall ist die Mittelung, welche sich durch folgende Koef- 
f izientenwerte darstellen laBt: 

a^ = l/N und bj_ = 1. 

3. Die Vorlage fiir Ersatzdaten kann auch durch Medianbil- 
dung iiber vergangene Energien erhalten werden. Dies sei 
durch folgende Gleichung dargestellt: 
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E v (f) = median {E^f), i = -1 -N} 

Bei der Medianbildung konnte alternativ auch das klein- 
ste, das zweitkleinste, . . . . , das zweitgroBte oder das 
groBte Element aus den E^(f) verwendet werden. 

4 . Die Vorlage f iir die Ersatzdaten auf grund der f iir die 
Untergruppe der intakten Audiodaten berechneten spek- 
tralen Energie kann jedoch auch mittels einer linearen 
adaptiven Pradiktion berechnet werden. Dies entspricht 
der im zweiten Fall dargelegten Gleichung, welche jedoch 
nun zeitabhangige Koef f izienten a^(t) haben muB. Fiir 
dicsen Fall konnen auch in der Zukunft liegende Energien 
berechnet werden. Eine lineare adaptive Pradiktion zum 
Bilden der Vorlage ftir Ersatzdaten ist dann besonders 
vorteilhaft, wenn mehr als ein Block Daten im Datenstrom 
fehlen bzw. ersetzt werden mussen. 

An dieser Stelle sei angemerkt, daB die vorstehende Liste 
zum Berechnen einer Vorlage fiir Ersatzdaten keinen Anspruch 
auf Vollstandigkeit erhebt. Wichtig ist nur, daB die Vorlage 
ftir die Ersatzdaten einer Untergruppe aus spektralen Ener- 
gien einer bestimmten Anzahl von vorausgehenden entsprechen- 
den Untergruppen intakter Audiodaten erhalten wird. 

Nachdem nun eine Vorlage ftir Ersatzdaten auf grund der fiir 
die Untergruppe der intakten Audiodaten berechneten spek- 
tralen Energie gebildet worden ist, besteht schlieBlich der 
letzte Schritt des Verfahrens darin, eben die Ersatzdaten zu 
erzeugen, die anstelle von fehlerhaften oder nicht vorhande- 
nen Audiodaten in den Audiodatenstrom eingesetzt bzw. sub- 
stituiert werden sollen. 

Es sollen Ersatzdaten erzeugt werden, die die gleiche spek- 
trale Energie pro Untergruppe wie die Vorlage fur die Er- 
satzdaten aufweisen sollen. Das grundsatzliche Verfahren 
besteht also darin, fehlerhafte bzw. nicht vorhandene Audio- 
daten , welche letztendlich Spektralkomponenten sein werden. 
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durch ktinstlich erzeugte Spektralkomponenten zu ersetzen. 
Die Randbedingung ist also, daB die kunstlich erzeugten 
Spektralkomponenten in einer Untergruppe zusammen dieselbe 
spektrale Energie aufweisen, die durch die Vorlage gegeben 
ist. Daftir existieren verschiedene Moglichkeiten. Es konnen 
beispielsweise alle Spektralwerte in einer Untergruppe 
gleichgesetzt werden, wobei die GroBe der Spektralwerte Oder 
Frequenzlinien dadurch gegeben ist, daB die spektrale Ener- 
gie derselben der entsprechenden spektralen Energie der Vor- 
lage entspricht. 

Eine weitere MSglichkeit konnte darin bestehen, von vorne- 
herein eine bestimmte Gewichtung festzulegen, welche darin 
bestehen konnte, Spektralwerte am Rand einer Untergruppe 
eher zu dampfen und Spektralwerte in der Mitte einer Unter- 
gruppe hervor zuheben . Die entsprechenden Spektralwerte zu- 
sammen mussen jedoch dieselbe spektrale Energie wie eine 
entsprechende Untergruppe der Vorlage haben. 

Das bevorzugte Verfahren zum Erzeugen von Ersatzdaten be- 
steht jedoch darin, alle Spektralkomponenten innerhalb einer 
Untergruppe auf gleichverteilte Zufallswerte X(f) zwischen 
-1 und +1 zu setzen, und nachtraglich eine Skalierung bzw. 
Normierung durchzuf uhren , bei der das eben erzeugte Signal 
im Pegel so angehoben/abgeschwacht wird, daB es innerhalb 
jeder Untergruppe die durch die Vorlage geforderte spektrale 
Energie besitzt. 

Hierzu muB nach der Erzeugung des Zuf allssignals X jede Li- 
nie X(f), welche per Definition einen Wert von zwischen -1 
und +1 haben wird, innerhalb der entsprechenden Untergruppe 
mit folgendem Quotienten, der auch als Normierungsf aktor a 
bezeichnet wird, multipliziert werden: 

a - V E v (f k )' / V SX(f) 2 ,- 

f e Untergruppe der Mittenf requenz f k 
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E v (f k ) stellt hier die spektrale Energie in der Vorlage in- 
nerhalb einer Untergruppe k der Mittenf requenz f k dar. 
E v (f k ) stellt also die Vorlage fur die Untergruppe k mit der 
Mittenf requenz f k dar. 

Zur Vereinf achung der vorherigen Vorschrift, um auf die Sum- 
mation im Nenner verzichten zu konnen, kann auch ein Zu- 
fallssignal erzeugt werden, welches zwischen +P und -P 
gleichverteilte Werte enthalt, wobei P folgendem Wert genii- 
gen muB: 

P - /3E v (f k )' 

Die Energie dieses Signals liegt dann mit hoher Wahrschein- 
lichkeit nahe bei der geforderten Energie Eyfffc) . Dies gilt 
sicherlich bei Untergruppen , die eine groBere (etwa 10) An- 
zahl von Frequenzlinien enthalten. Dies liegt daran, daB das 
Quadratmittel aus gleichverteilten Werten zwischen -1 und +1 
gleich 1/3 ist. 

Die nun erzeugten Ersatzdaten bzw. Spektralkomponenten fiir 
die Untergruppe werden von einem Decodierer genauso verar- 
beitet wie fehlerfreie Daten bzw. Spektralwerte . Aufgrund 
der Tatsache, daB nun die spektralen Energien der Untergrup- 
pen in den kunstlich erzeugten Daten den spektralen Energien 
der Untergruppen im letzten intakten Block entsprechen oder 
aus den spektralen Energien von Untergruppen mehrerer vor- 
ausgehender Blocke abgeleitet sind, wird der Block mit 
kiinstlich erzeugten Ersatzdaten bzw. die Blocke mit kunst- 
lich erzeugten Ersatzdaten bei einigermaBen gleichverteilter 
Signal stat is tik des Audiosignals unhorbar sein. Ein Fehler 
wird also verschleiert sein. 

Bei dem erf indungsgemaBen Verfahren zum Verschleiern von 
Fehlern in einem Audiodatenstrom konnen jedoch instationare 
Signale problematisch sein, da dann als Basis der Substitu- 
tion moglicherweise ein Block mit fiir das Signal atypischer 
Statistik verwendet wird. Um zu verhindem, daB ein Block 
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mit atypischer Statistik, auf den unmittelbar ein fehlerhaf- 
ter Block folgt, das Bilden einer Vorlage fur Ersatzdaten 
fiir den fehlerhaften Block dominiert, wodurch horbare Fehler 
eingefuhrt werden konnten, kann es gunstig sein, nicht nur 
den letzten intakten Block, sondern mehrere zuletzt vor- 
handene intakte Blocke zu speichern und dann fiir eine eben 
genannte Pradiktion zu verwenden, um eine Vorlage ftir Er- 
satzdaten zu erhalten, die die groBere Tendenz des Signal- 
verlaufs bzw. der Signalstatistik und nicht nur die Stati- 
stik bzw. den Verlauf eines Blocks berxicksichtigt • 

Enthalt das ungestorte oder intakte Signal oder der unge- 
storte oder intakte Audiodatenstrom eine prominent e oder 
herausragende Spektralkomponente, die nahe am Rand einer 
Untergruppe liegt, so wird ein durch das eben beschriebene 
Verfahren erzeugtes innerhalb der Untergruppe gleichver- 
teiltes ("weisses") Rauschen mit einer anderen Tonhohe, 
namlich der Mittenf requenz der Untergruppe, empfunden. Um 
diesen Effekt zu vermeiden, sollten die Untergruppen in 
Frequenzbereichen, in denen das Ohr auf solche Tonhohen- 
schwankungen empfindlich ist, schmal gewahlt werden, even- 
tuell nur eine Frequenzlinie breit. Im letzten Fall verein- 
facht sich das Verfahren, da - statt mit dem Betragsquadrat 
der Spektralkomponente der Vorlage zu rechnen - direkt die 
Spektralkomponente der Vorlage mit einer aus (+1,-1) zufSl- 
lig gew&hlten Zahl multipliziert werden kann* 
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Patentansprliche 

1. Verfahren zum Verschleiern von Fehlern in einem Audio- 
datenstrom mit folgenden Schritten: 

Erf assen des Auftretens eines Fehlers in einem Audioda- 
tenstrom, wobei Audiodaten vor Auftreten des Fehlers 
intakte Audiodaten sind; 

Berechnen einer spektralen Energie einer Untergruppe 
der intakten Audiodaten; 

Bilden einer Vorlage fur Ersatzdaten aufgrund der fur 
die Untergruppe der intakten Audiodaten berechneten 
spektralen Energie; und 

Erzeugen von Ersatzdaten fur fehlerhafte oder nicht 
vorhandene Audiodaten , die der Untergruppe entsprechen, 
aufgrund der Vorlage. 

2. Verfahren nach Anspruch 1, 

bei dem der Audiodatenstrom auf einanderf olgende Daten- 
blocke aufweist # wobei ein Datenblock Audiodaten auf- 
weist, die einer bestimmten zeitlichen Blockdauer ent- 
sprechen; 

bei dem bei Auftreten eines fehlerhaften Datenblocks 
die spektralen Energien fiir jede Untergruppe des letz- 
ten intakten Datenblocks berechnet werden; und 

bei dem die Ersatzdaten fiir jede Untergruppe des feh- 
lerhaften Datenblocks die spektralen Energien der ent- 
sprechenden Untergruppe des letzten intakten Daten- 
blocks aufweisen. 

3. Verfahren nach Anspruch 1, 
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bei dem der Audiodatenstrom auf einanderf olgende Daten- 
blocke aufweist, wobei ein Datenblock Audiodaten auf- 
weist, die einer bestimmten zeitlichen Blockdauer ent- 
spr echen ; 

bei dem bei Auftreten eines f ehlerhaf ten Datenblocks 
die spektralen Energien fiir entsprechende Untergruppen 
von zumindest zwei vorausgehenden intakten Datenblocken 
berechnet werden; und 

bei dem die Ersatzdaten fur jede Untergruppe des feh- 
lerhaften Datenblocks mittels Pradiktion aus den ent- 
sprechenden Untergruppen der zumindest zwei voraus- 
gehenden intakten Datenblocke ermittelt werden. 

4. Verfahren nach einem der vorhergehenden Anspruche, bei 
dem die spektralen Energien pro Untergruppe der Vorlage 
das Ergebnis einer linear en Kombination aus Potenzen 
der spektralen Energien entsprechender Untergruppen der 
vorausgehenden intakten Datenblocke darstellen. 

5- Verfahren nach einem der Anspruche 1 bis 3, bei dem die 
spektralen Energien pro Untergruppe der Vorlage das Er- 
gebnis einer Mittelung ttber die spektralen Energien 
entsprechender Untergruppen der vorausgehenden intakten 
Datenblocke darstellen. 

6. Verfahren gemaB einem der Anspriiche 1 bis 3, bei dem 
die spektralen Energien pro Untergruppe der Vorlage 
durch Medianbi ldung iiber die spektralen Energien ent- 
sprechender Untergruppen der vorausgehenden intakten 
Datenblocke entstehen. 

7. Verfahren gemaB einem der Anspruche 1 bis 3, bei dem 
die spektralen Energien pro Untergruppe der Vorlage 
durch eine linear e adaptive Pradiktion iiber die spek- 
tralen Energien entsprechender Untergruppen der vor- 
ausgehenden intakten Datenblocke entstehen. 
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8. Verfahren gemafi einem der vorhergehenden Anspriiche, bei 
dem der Schritt des Erzeugens von Ersatzdaten folgende 
Schritte aufweist: 

Einstellen von Audiodaten innerhalb einer Untergruppe 
auf gleichverteilte Zufallswerte zwischen -1 und +l; 
und 

Skalieren der eingestellten Audiodaten, derart, daB die 
spektrale Energie der eingestellten Audiodaten der Un- 
tergruppe gleich der Vorlage fur die Ersatzdaten fur 
die Untergruppe der intakten Audiodaten ist. 

9. Verfahren gemaB einem der vorhergehenden Anspriiche, bei 
dem die Daten des Audiodatenstroms bereits im Frequenz- 
bereich vorliegen. 

10. Verfahren gemaB einem der vorhergehenden Anspriiche, bei 
dem vor dem Erfassen des Auftretens eines Fehlers in 
einem Audiodatenstrom folgende Schritte ausgefuhrt wer- 
den: 

Empf angen des Audiodatenstroms ; und 

Speichern zumindest der zeitlich zuletzt empfangenen 
Daten des Audiodatenstroms in der Reihenfolge, die 
durch den Audiodatenstrom vorgegeben ist. 
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